分类算法系列之K近邻算法

作者：萌新之机器学习时间：2024-01-10 阅读：2515

一、KNN算法基本思想

K近邻算法，即KNN算法，可用于分类。该算法的基本思想非常简单：给定带标签的训练样本集，对于测试样本，根据事先设定的距离度量计算测试样本与每一个训练样本的距离，选出K个距离最近的训练样本，然后基于投票的方式将测试样本标记为k个训练样本中出现次数最多的类别。

KNN算法在训练阶段不产生模型，仅仅是将样本保存起来，训练的时间开销为零，是懒惰学习的典型代表。

二、KNN算法调优策略

距离度量的选择

选择合适的距离度量很重要，常用的距离有欧式距离、曼哈顿距离等。此后会有详细的距离度量的文章。

k的选择

k的选择非常重要。以下图为例，不同的k，分类结果会有显著的差别。

以二分类为例，图中蓝色加号代表正类，紫色减号代表负类，橙色三角形是待判样本。取k=3时，待判样本被标记为正类，取k=11时，待判样本被标识为负类，取k=15时，待判样本被标记为正类。

一般情况下，我们可将样本分为训练集和测试集，多尝试几组k值，通过测试样本的分类效果来确定合适的k值。

样本不平横问题

考虑如下情况。

以上图为例，针对这种样本不平衡的情况，很容易就会将测试样本标识为正类。我们可对负类样本进行重采用，对正类样本进行欠采样，其实本质就是调整样本权重。

三、优缺点分析

KNN算法简单有效，对数据的分布没有要求，训练阶段仅是保存数据，时间开销为零。由于KNN算法不产生模型，它在发现特征之间的关系上的能力有限，另外就是分类阶段很慢，因为该算法需要计算测试样本与每一个训练样本的距离，需要大量的内存，而且名义变量要额外处理。

上一篇：R语言第21篇——实例：买房不（九）距离

下一篇：厨房门口两边柜子图(冰箱放在进厨房的门边

猜你喜欢

什么电梯好(永大电梯和通力哪个好)

什么电梯好(永大电梯和通力哪个好)

知识 2023-11-02 1261

好评的超b级锁芯(金点原子防盗门锁芯价格)

好评的超b级锁芯(金点原子防盗门锁芯价格)

知识 2023-11-02 3499

女生榻榻米小房间图片(2米5长的榻榻米怎么样从卧室移出来)

女生榻榻米小房间图片(2米5长的榻榻米怎么样从卧室移出来)

知识 2023-11-04 331

窗帘哪种布料隔热(哪种不遮光但窗帘最隔热)

窗帘哪种布料隔热(哪种不遮光但窗帘最隔热)

资讯 2023-11-05 1362

贝朗卫浴客服(贝朗成立时间是多久)

贝朗卫浴客服(贝朗成立时间是多久)

资讯 2023-11-07 2137

全屋装修关键词(怎样装修能体现个人底蕴)

全屋装修关键词(怎样装修能体现个人底蕴)

资讯 2023-11-15 2928

济南宜家吃饭时间(济南宜家家居2021年春节营业时间)

济南宜家吃饭时间(济南宜家家居2021年春节营业时间)

知识 2023-11-15 4746

建筑装饰设计专项乙级资质业务模版(中七华贸建工集团是国企吗)

建筑装饰设计专项乙级资质业务模版(中七华贸建工集团是国企吗)

资讯 2023-11-17 696

大宝漆规格(大宝水性漆环保吗)

大宝漆规格(大宝水性漆环保吗)

资讯 2023-11-19 1459

锦纶是什么面料英文(zg251是什么材质)

锦纶是什么面料英文(zg251是什么材质)

资讯 2023-11-22 4721

地胶板怎么清除(健身地胶橡胶味怎么去除)

地胶板怎么清除(健身地胶橡胶味怎么去除)

知识 2023-11-24 898

怎么找装修队(请问大家装修房子都会通过什么渠道去找装修公司)

怎么找装修队(请问大家装修房子都会通过什么渠道去找装修公司)

资讯 2023-11-25 108

彩钢板房每平米多少钱(彩钢铝房顶全包一平米多少钱)

彩钢板房每平米多少钱(彩钢铝房顶全包一平米多少钱)

知识 2024-01-16 1657

黑龙江省双鸭山市：“1＋7”式推进专项治理，筑牢食用植物油质量安全防线

黑龙江省双鸭山市：“1＋7”式推进专项治理，筑牢食用植物油质量安全防线

资讯 2024-01-26 1325

亚洲杯战报，韩国5:3点杀晋级，沙特泰国出局，1/4决赛定三组对决

亚洲杯战报，韩国5:3点杀晋级，沙特泰国出局，1/4决赛定三组对决

资讯 2024-01-31 2816

卢志荣、凌宗湧都在，这场设计美学盛会有感动有干货

卢志荣、凌宗湧都在，这场设计美学盛会有感动有干货

知识 2024-02-01 2334

洛阳地方国营十大厂矿的前世与今生：序言

洛阳地方国营十大厂矿的前世与今生：序言

资讯 2024-02-08 805

大宝品牌官网(大宝sod蜜的品牌定义)

大宝品牌官网(大宝sod蜜的品牌定义)

知识 2024-02-16 1402

“轨道上的京津冀”不断加速出行有了这些新变化

“轨道上的京津冀”不断加速出行有了这些新变化

知识 2024-02-29 2032

北京口碑好防腐木价格(金盾木门怎么样)

北京口碑好防腐木价格(金盾木门怎么样)

知识 2024-03-13 4573